moe模型

小米北大提出R3方法：终结MoE模型强化学习崩盘，训练推理对齐度提升50%

小米北大提出R3方法：终结MoE模型强化学习崩盘，训练推理对齐度提升50%

小米集团与北京大学联合在arXiv平台发表重磅论文，以“95后AI天才少女”罗福莉为通讯作者之一的研究团队，提出名为Rollout Routing Replay（R3）的创新性方法，成功攻克混合专家（MoE）模型在强化学习（RL）训练中的稳定性难题。这一突破不

模型推理 moe r3 moe模型 2025-10-18 00:34 11

开发者故事 | 基于 DOCA GPUNetIO 的 MoE 模型推理加速实践

开发者故事 | 基于 DOCA GPUNetIO 的 MoE 模型推理加速实践

在第三届 NVIDIA DPU 中国黑客松竞赛中，我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中，有 5 支队伍脱颖而出，展现了在 AI 网络、存储和安全等领域的创新突破。

推理 moe moe模型 gpunetio doca 2025-09-17 18:23 15

6.1B打平40B Dense模型，蚂蚁开源最新MoE模型Ling-flash-2.0

6.1B打平40B Dense模型，蚂蚁开源最新MoE模型Ling-flash-2.0

今天，蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型，Ling-flash-2.0 以总参数 100B、激活仅 6.1B（non-embedding 激活 4.8B）的轻量级配置

模型开源 moe moe模型 dense模型 2025-09-17 17:35 14